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fi 2: [目的 /意义 ] 回顾 计算 档案 学 发 展现 状 ,探索 计算 档案 学 在 中 国 的 发 展 策略 ,为 新 文科 建设 背景 下 中 国 计 算 档案 
学 的 发 展 提供 参考 。[ 方 法 /过 程 ] 基 于 文献 研究 梳理 计算 档案 学 的 发 展现 状 ,运用 SWOT 分 析 法 剖析 计算 档案 学 
在 国内 发 展 的 机 会 、 威 胁 、 优 势 、 劣 势 等 内 外 部 环境 要 素 , 并 通过 内 外 要 素 交 叉 匹 配 形成 不 同 发 展 策略 。[ 结果 / 结 
论 ] 研 究 发 现 ,计算 档案 学 的 发 展 在 国际 上 得 到 持续 关注 ,上 且 围绕 基础 理论 .教育 研究 、 档 案 处 理 、 档 案 分 析 、 档 案 


体系 。 
计算 档案 学 ”新 文科 数据 转型 ”档案 教育 


化 处 理 等 方面 初步 确立 了 理论 研究 与 实践 探索 的 方向 ,但 总 体 上 ,计算 档案 学 的 发 展 尚 处 于 初步 探索 阶段 。 中 
推进 计算 档案 学 需要 注重 :依托 交叉 学 科 的 建设 机 遇 , 打 造 超 学 科研 究 平台 ;瞄准 领域 信息 化 战略 需求 ,形成 规模 
化 研究 方向 ;厘清 与 相关 学 科 的 边界 ,突出 计算 档案 学 的 特色 ;发 挥 超 学 科 的 研究 优势 ,规避 数据 安全 隐私 风险 ; 
抓 住 复合 型 人 才 培 养 契 机 ,整合 多 方 资源 共 建 教学 平台 ;围绕 实践 领域 的 核心 问题 ,探索 可 操作 的 技术 解决 方案 ; 
加 强制 度 设计 与 技术 攻坚 ,做 好 档案 安全 风险 评估 与 管控 ;加 大 基础 研究 ,明晰 计算 档案 学 的 理论 、 方 法 和 技术 


之 自 2006 年 以 来 , 云 计算 ,大 数据 .人工 智能 等 技术 
成 让 推动 社会 演进 的 主要 动力 。 这 些 新 兴 技 术 产业 提 
供 移 技 术 更 新 .思想 支撑 和 研究 方法 ,使 得 计算 思维 的 
运 时 跳出 经 济 的 范畴 ,衍生 出 更 多 与 之 相关 的 思维 模 
式 短路 领域 实践 ,计算 社会 科学 .计算 语言 学 等 “计算 
+ 学科" 成 为 大 数据 时 代 的 新 兴学 科 范 式 。 随 着 数 知 
时 代 的 到 来 ,日 趋 复杂 的 技术 环境 同样 也 让 人 们 认识 
到 传统 的 文件 与 档案 管理 实践 要 实现 数字 转型 就 需要 
计算 理论 方法 的 引入 ;而 新 的 档案 形式 和 档案 问题 的 
出 现 ,不 仅 需 要 计算 机 科学 等 学 科 的 介入 ,更 需要 档案 
图 论 方法 的 助力 。 在 这 种 新 的 双向 需求 刺激 下 ,强调 
计算 理论 方法 与 档案 理论 方法 融合 的 计算 档案 学 兴起 
具有 必然 性 。 

一 方面 ,新 兴 的 原生 数字 档案 的 生产 和 消费 由 社 
会 和 工业 趋势 以 及 与 档案 方法 几乎 没有 联系 的 计算 机 
和 数据 方法 所 决定 。 要 了 解 它们 的 生产 和 消费 特征 、 
治理 要 点 ,解决 规模 化 原生 数字 档案 的 处 理 、 分 析 、 存 


Md 


it 长 期 保存 和 获取 问题 ,就 需要 计算 机 科学 等 学 科 的 
助力 ,尤其 是 计算 方法 和 资源 的 应 用 。 同 时 ,要 确保 新 
形式 文件 和 档案 的 真实 性 .完整 性 .可靠 性 .可 用 人 性、 安 
全 性 等 特征 ,也 需要 档案 学 的 介入 。 面 对 新 的 档案 形 
式 , 多 学 科 领 域 共同 应 对 是 必然 趋势 。 另 一 方面 ,传统 
档案 工作 正 加 速 推进 数 智 转 型 ,档案 数据 驱动 的 研究 
活动 兴起 ,使 得 大 规模 档案 材料 的 数据 化 加 工 、 处 理 、 
关联 、 分析、 挖掘 等 成 为 挑战 。 同 时 ,技术 赋 能 档案 工 
作 的 需求 愈 发 凸显 ,文件 归档 、 开 放 鉴 定 和 敏感 性 审查 
等 工作 实现 自动 化 .智能 化 以 提升 工作 效率 的 目标 逐 
渐 清 晰 。 总 之 , 面 对 新 的 档案 实践 ,传统 档案 领域 面临 
理论 方法 ,技术 的 局 限 ,传统 档案 理论 ,方法 和 技术 无 
法 解决 新 的 档案 实践 带 来 的 大 规模 处 理 与 应 用 的 挑 
战 ,当代 档案 工作 需要 计算 思维 和 方法 的 引入 。 

为 深入 探索 计算 与 档案 在 思维 、 理 论 .方法 中 的 高 
级 融合 形式 ,在 2016 年 美国 马里 兰 大 学 举办 的 以 “发 
现 新 知识 :大 数据 时 代 的 档案 文件 ”为 主题 的 计算 档案 
学 专题 研讨 会 上 ,计算 档案 学 (Computational Archival 
Science) 概念 被 提出 ,随后 召开 的 首届 IEEE 计算 档案 
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学 工作 坊 将 其 初步 认定 为 交叉 学 科 , 该 学 科 旨 在 将 计 
算 方法 和 资源 应 用 于 大 规模 文件 /档案 的 处 理 、 分 析 、 
存储 .长 期 保存 和 获取 ,以 提高 效率 .生产 力 和 精确 度 ， 
便于 支持 鉴定 .整理 和 描述 .保存 和 获取 决策 以 及 使 用 
档案 材料 进行 研究 ""。 随 后 ,国外 学 者 对 此 概念 涉及 
的 学 术 领 域 进行 了 持续 .广泛 的 探索 。 近 年 来 ,国内 学 
者 也 注意 到 国外 计算 档案 学 的 发 展 趋势 , 传 天 珍 于 
2019 年 发 文 总 结 了 计算 档案 学 的 发 展 历程 .定义 和 特 
GE). WO JSC!) quei . 刘 越 男 等 中 pae 
香 等 四 也 基于 文献 研究 方法 对 国外 计算 档案 学 发 展 情 
况 进行 了 多 角度 的 透视 。 赵 跃 等 ”基于 中 国 图 情 档 界 
的 计算 档案 学 认 知 调查 ,剖析 了 计算 档案 学 在 中 国 的 
发 展 前 景 。 本 文 将 在 相关 研究 基础 上 ,借助 SWOT 分 
析 法 探讨 计算 档案 学 在 中 国 的 发 展 策略 ,以 期 对 此 领 
域 的 进一步 研究 与 实践 有 所 启示 。 


十 算 档 案 学 发 展现 状 回 顾 


25 作为 一 个 超 学 科研 究 领域 得 到 持续 关注 
< 寺 刘 越 男 等 “对 计算 档案 学 在 国外 的 发 展 进程 进行 
于 而 下 系统 梳理 :2015 年 美国 马里 兰 大 学 信息 学 院 R. 
Mixéiano 教授 组 建 的 探讨 利用 计算 方法 解决 档案 问题 
的 ZB 型 跨 学 科研 究 小 组 ,被 认为 是 国际 上 计算 档案 学 
tig, 2016 年 4 月 在 马里 兰 大 学 召开 的 计算 档案 学 
专题 研讨 会 ,宣告 跨 地 域 跨 学 科 的 学 术 社区 初步 形成 ， 
6 社会 议 发 起 人 此 后 一 直 是 此 领域 的 中 坚 力量 , 受 邀 
代 天 来 自 英国 .加拿大 ,南非 和 美国 的 高 校 . 研 究 机 构 、 
政府 机 构 .文化 机 构 和 合作 组 织 。 经 过 4 年 的 发 展 , 计 
算 同 案 学 社区 进一步 吸纳 了 美国 多 个 高 校 . 州 档案 馆 
以 及 巴西 利 亚 大 学 ,英国 阿兰 .图 灵 研 究 院 、 阿 姆 斯 特 
丹 大 学 .印度 古吉拉特邦 中 央 大 学 .印度 管理 研究 所 、 
日 本 九州 大 学 .堪培拉 大 学 等 各 国 高 校 和 研究 机 构 的 
研究 人 员 。 该 学 术 社区 通过 举办 学 术 会 议 .发布 专刊 、 
开展 合作 研究 等 方式 不 断 扩大 规模 ,加 深 探 索 ,推动 计 
算 档 案 学 的 发 展 。 在 学 术 会 议 方面 , 据 不 完全 统计 ， 
2016 - 2020 年 间 计算 档案 学 学 术 社区 以 工作 坊 的 形 
式 发 起 过 27 场 学 术 活 动 ,不 乏 由 知名 计算 科学 研究 机 
构 主 办 的 学 术 会 议 ,如 英国 阿兰 + 图 灵 研 究 院 2020 年 
举办 的 计算 档案 学 讨论 会 。 其 中 最 有 代表 性 的 是 始 于 
2016 年 的 IEEE 大 数据 计算 档案 学 工作 坊 , 至今 已 连 
续 举 办 5 届 , 体 现 了 以 计算 科学 为 主要 阵地 的 大 数据 
领域 对 跨 学 科 的 计算 档案 学 的 重视 ,并 吸引 了 越 来 越 
多 来 自 计 算 机 科学 .档案 学 .信息 科学 、 图 书馆 学 .历史 
学 .艺术 学 等 领域 的 学 者 加 入 ,计算 档案 学 的 学 术 社区 


持续 扩大 。 

IEEE 大 数据 计算 档案 学 工作 坊 自 2016 年 起 共产 
出 62 篇 会 议论 文 ,发 表 数 量 呈 年 度 递 增 态 势 ,体现 出 
计算 档案 学 受到 的 持续 关注 趋势 。 除 此 之 外 ,笔者 进 
一 步 VA “ computational archival science ”为 检索 词 在 
Google scholar 以 及 Emerald 等 学 术 搜 索引 擎 和 数据 库 
进行 检索 (检索 时 间 为 2021 £2 H 10 日 ), 经 人 工 判 
读 剔除 重复 和 不 相关 的 记录 后 ,又 获得 13 篇 有 效 外 文 
文献 。 通 过 对 文献 作者 的 统计 发 现 ,75 篇 文献 来 自 19 
个 国家 (地 区 ) 的 243 名 学 者 ,可 见 计算 档案 学 在 发 展 
初期 便 得 到 了 较 多 国家 研究 人 员 的 关注 。 从 作者 分 布 
情况 来 看 ,19 个 国家 (地 区 ) 中 ,来 自 美国 的 学 者 最 多 ， 
^H 163 名 ,其 次 为 加 拿 大 (21 名 ) 和 英国 (9 名 ) ;243 名 
学 者 中 ,来 自 马 里 兰 大 学 信息 学 院 的 教授 发 文 较 多 ， 
R. Marciano 发 文 最 多 ,有 14 篇 ,其 次 为 W. Underwood 
(9 篇 ) 和 G. Jansen (6 篇 ) ;发 文 数量 3 篇 及 以 上 的 作 
者 均 来 自 图 书 情报 与 档案 管理 领域 ,可 见 图 书 情报 与 
档案 管理 学 科 在 计算 档案 学 建设 中 的 基础 性 作用 。 从 
作者 合作 情况 来 看 ,75 篇 文章 中 ,由 2 名 及 以 上 学 者 
合作 完成 率 达 到 60% ,体现 出 计算 档案 学 研究 具有 较 
高 的 合作 度 。 从 机 构 合 作 情 况 来 看 ,由 2 个 及 以 上 机 
构 合 作 完成 的 文章 数 占 比 为 46. 7% ,机 构 合作 度 较 
高 。 在 具体 的 机 构 合 作 方式 上 ,10 篇 文章 由 高 校 间 跨 
校 合 作 完 成 ,4 篇 文章 由 非 高 校 跨 机 构 合作 完成 ,8 篇 
文章 由 校内 跨 院 系 或 单位 合作 完成 ,8 篇 文章 由 校内 
外 跨 机 构 合 作 完成 ,3 篇 文章 由 跨 校 跨 机 构 多 方 合作 
完成 ,1 篇 文章 由 路 院 系 跨 机 构 多 方 合 作 完成 ,1 篇 文 
章 由 跨 院 系 跨 校 跨 机 构 多 方 合 作 完 成 ,再 次 突出 了 合 
作 , 尤 其 是 跨 学 科 的 合作 对 于 计算 档案 学 研究 的 重 
要 性 。 

此 外 ,75 篇 文献 共 涉 及 138 所 机 构 , 其 中 美国 马 9 
兰 大 学 信息 学 院 发 文 最 多 (17 篇 ) ,其 次 为 加 拿 大 英 
哥伦比亚 大 学 信息 学 院 (8 篇 ) .英国 伦敦 国王 学 院 数 
字 人 文系 (5 篇 ) ,发 文 量 超过 2 篇 的 11 个 机 构 多 为 高 
校 研究 机 构 , 可 见 高 校 研 究 机 构 在 计算 档案 学 领域 发 
展 中 起 着 核心 的 推动 作用 。 其 中 ,马里 兰 大 学 信息 学 
院 .加 拿 大英 属 哥 伦比 亚 大 学 信息 学 院 以 及 英国 伦敦 
司 王 学 院 数字 人 文系 更 是 计算 档案 学 研究 的 核心 
机 构 。 

马里 兰 大 学 信息 学 院 致 力 于 开发 智 总 城市 技术 ， 
创建 新 兴 的 存档 方法 ,其 立足 于 46 个 研究 资助 项 目 和 
多 个 研究 中 心 ( 如 社会 数据 科学 中 心 .计算 语言 学 和 信 
息 处 理 中 心 、 人 机 交互 实验 室 、 社 区 信息 高 级 研究 中 
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心 .档案 未 来 中 心 Trace OR Hue"! ) ,开拓 了 计算 
档案 学 ,数字 人 文 .计算 语言 学 、 人 机 交互 等 14 个 研究 
领域 。 其 中 ,2015 年 R. Marciano 教授 创立 的 数字 管 护 
创新 中 心 ”, 尤 其 注重 探索 档案 数据 和 技术 的 融合 形 
式 , 开 拓 新 兴 档 案 分 析 形 式 , 加 深 历史 、 社 会 .科学 和 文 
化 研究 与 档案 的 结合 。 自 成 立 以 来 ,该 中 心 与 多 方 合 
作 研究 了 10 余 个 跨 学 科 项 目 ( 如 与 马里 兰州 档案 馆 合 
作 开 展 的 奴隶 制 遗 产 项 目 "" .与 NARA 合作 开展 的 二 
战 档案 专题 项 目 "- 中 ) ,成 为 推动 计算 档案 学 发 展 的 
中 坚 力量 。 

英 属 哥 伦比 亚 大 学 信息 学 院 建设 了 具备 智能 设备 
的 Kitimat 实验 室 .露台 实验 室 ,格雷 格 实验 室 ,以 用 于 
网 站 研究 或 焦点 研讨 ,还 设立 了 专门 的 技术 顾问 提供 
个性 化 帮助 ,涵盖 面向 SQL 数据库、 网 站 开发 编程. 原 
弄 谤 计 等 多 个 技术 主题 。 该 学 院 档案 学 方向 的 V. Le- 
mieux ,N. Payne 及 各 自 团队 在 区 块 链 、 人 工 智能 等 领域 
进 稳 了 创新 性 探索 ,是 计算 档案 学 领域 的 核心 力量 之 


整理 和 描述 ;@@ 可 扩展 的 档案 服务 ,包括 识别 ,保存 \ 元 
数据 生成 .完整 性 检查 、 规 范 化 、 对 账 关 联 数据 、 实 体 
提取 、 匿 名 化 和 缩减 ;也 新 的 档案 形式 ,包括 网 络 、 社 交 
媒体 .视听 档案 和 区 块 链 ;@ 网 络 基 础 设施 ,用 于 基于 
档案 的 研究 以 及 馆藏 的 开发 和 托管 ;@ 大 数据 和 档案 
理论 与 实践 ;9 数字 管 护 与 保存 ;@@ 众 包 和 档案 ;GO 大 
数据 以 及 记忆 与 身份 的 构建 ;@ 特 定 的 大 数据 技术 ( 例 
如 NoSQL 数据 库 ) 及 其 应 用 ;外 大 档案 数据 的 语料库 
和 参考 集合 ;加 关联 数据 和 档案 ;3 大 数据 和 来 源 ;加 
从 档案 中 构建 大 数据 研究 对 象 ;四 大 数据 档案 中 的 法 
律 和 道德 问题 。 

这 些 主题 初步 罗列 出 计算 档案 学 相关 实践 探索 方 
向 ,后 来 R. Marciano 等 总 结 了 驱动 计算 档案 学 研究 的 
8 个 典型 实践 :中 进化 原型 和 计算 语言 学 ;@ 思 图 形 分 析 
与 数字 人 文 ;四 计算 机 检索 工具 ;由 数字 管 护 ; 吕 公众 
参与 (档案 ) 内 容 ;@@ 真 实 性 ;GO 网 络 基础 设施 和 文件 
连续 体 ;@ 空 间 和 时 间 分 析 ” ,进一步 勾勒 出 计算 档 


GEV. Lemieux 团队 开发 了 基于 区 块 链 的 处 置 应 用 程 
Feil ArchContracure” $ (j£ 229 7 ,并 应 用 到 在 土地 交 
刁 医 疗 记录 和 财务 文件 管理 等 领域 。N. Payne fi 
十 了 分 类 精准 度 和 文件 联系 度 并 重 的 系统 ,并 
持 文件 自动 分 类 的 新 型 背景 信息 捕获 框 


称 儿 会 以 及 用 于 人 文 社 科研 究 的 先进 技术 方法 '” BE 
立 红 数 字 文化 与 数字 媒介 ,数字 方法 与 数字 设备 ,数字 
社 医 参与 平台 与 渠道 3 个 主要 方向 。 为 弥补 软件 工程 
和 找 术 管理 方面 的 不 足 ,2015 年 还 建设 了 拥有 软件 工 
程 团队 的 独立 数字 实验 室 , 立 足 于 不 同行 业 的 实践 需 
求 ,实验 室 组 建 了 由 研究 软件 分 析 师 .工程 师 .UVUX 
设计 师 项 目 经 理 和 系统 经 理 组 成 的 团队 ,承接 了 100 
余 项 数字 人 文 项 目 (如 欧洲 大 屠杀 基础 设施 项 目 ( Eu- 
ropean Holocaust Research Infrastructure , EHRI ) P 欧 
洲 大 数据 和 社会 挖掘 研究 基础 设施 项 目 ”) 。 此 外 ， 
2019 年 ,伦敦 国王 学 院 数字 人 文系 与 马里 兰 大 学 信息 
学 院 .马里 兰州 档案 馆 、 英 国 国家 档案 馆 合作 ,成立 计 
算 档案 学 国际 研究 合作 网 ,开展 为 期 一 年 的 合作 以 进 
一 步 推动 计算 档案 学 跨 学 科 探索 与 实践 ” 。 
2.2 理论 研究 与 实践 探索 的 方向 已 初步 确立 

2016 年 以 来 ,IEEE 大 数据 计算 档案 学 工作 坊 形成 
了 较为 稳定 的 讨论 主题 :分 析 在 档案 材料 中 的 应 用 ， 
包括 文本 挖掘 数据 挖掘 情感 分 析 ` 网 络 分 析 ; @) 支 持 
档案 处 理 的 分 析 , 包 括 电子 发 现 . 个 人 信息 识别 、 鉴 定 、 


案 学 的 “领地 范围 ,并 促成 一 些 核心 研究 领域 的 形 
成 ,如 档案 材料 分 析 、 新 形式 档案 开发 .档案 化 处 理 的 
拓展 服务 、 大 数据 和 档案 的 理论 与 实践 等 ”。 但 是 ， 
要 在 众多 计算 和 档案 研究 中 划 清 计算 档案 学 边界 非常 
困难 ,M. Lee 等 提出 评估 计算 档案 学 研究 的 启发 式 方 
法 ,用 以 评估 研究 问题 是 否 属 于 此 领域 核心 问题 , 认为 
“计算 思维 解决 档案 问题 "不 一 定 属于 计算 档案 学 范 
畴 ,计算 档案 学 研究 应 该 以 档案 和 计算 问题 的 共同 目 
标 为 切 人 点 ,融合 档案 和 计算 的 理论 形成 自己 的 专业 
和 新 的 理论 ,此 方法 对 于 判定 计算 档案 学 的 核心 问 
题 有 一 定 启示 ,但 无 法 用 以 准确 划分 计算 档案 学 研究 
领域 和 边界 。 

通过 对 国内 外 计算 档案 学 领域 文献 研究 主题 的 分 
析 , 笔 者 认为 当前 计算 档案 学 领域 已 经 初步 确立 包括 
基础 理论 ,教育 研究 .档案 处 理 、 档 案 分 析 和 档案 化 处 
FES 个 方向 。 计 算 档 案 学 基础 理论 研究 致力 于 阐释 计 
算 档 案 学 相关 概念 .特征 研究 框架 与 学 科 属 性 等 。 例 
如 ,在 概念 方面 ,2018 年 ,R. Marciano 等 对 2016 年 首届 
IEEE 计算 档案 学 工作 坊 上 提出 的 初步 定义 "进行 了 
更 新 ” ,将 交叉 学 科 ( interdisciplinary ) 更 改 为 超 学 科 
(transdisciplinary ) ,强调 学 科 知 识 的 融合 。 后 来 ,也 有 
学 者 对 计算 档案 学 的 定义 进行 了 进一步 扩充 和 阐 
释 “。 但 目前 ,计算 档案 学 的 定义 仍 是 不 断 发 展 的 ， 
当前 定义 没有 充分 反映 在 超 学 科 下 基础 学 科 之 间 的 知 
识 交 换 , 仍 具有 局 限 ;关于 学 科 属 性 ,一 般 认为 计算 档 
案 学 是 计算 机 科学 与 档案 学 的 双向 互动 ,是 其 要 素 重 
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组 与 融合 创造 的 新 超 学 科 领 域 ,但 也 有 学 者 提出 要 以 
档案 学 .信息 科学 和 计算 机 科学 为 基础 ” ,甚至 有 学 


分 散 的 大 屠杀 相关 材料 数据 ,并 创建 API 目录 实现 元 
数据 收取 关联、 检索 功能 ,在 门户 网 站 提供 元 数据 跨 


者 指出 计算 档案 学 并 非 一 个 新 的 科学 领域 ,而 只 是 一 
个 信息 技术 方法 不 断 扩大 的 档案 学 方向 “。 此 外 ,还 
有 学 者 强调 计算 档案 学 的 工程 属性 ,进一步 提出 档案 
工程 的 概念 ,认为 计算 档案 学 的 价值 只 有 在 提供 产品 
和 服务 时 才能 实现 *1。 

计算 档案 学 教育 研究 方向 主要 关注 计算 思维 与 档 
案 思维 相关 教育 .培训 与 课程 设置 等 问题 。H. Stantic 
等 调查 发 现 ,在 信息 通讯 技术 影响 下 ,2003 - 2016 年 
欧洲 高 校 档案 学 专业 课程 设置 扩充 到 信息 系统 .数字 
保存 等 方面 ,他 们 认为 档案 工作 者 还 需 进 一 步 学 习 语 
义 网 .图 数据 库 .机 器 学 习 等 技术 29 ;马里兰 大 学 信息 
学 院 则 提出 了 由 22 种 计算 实践 构成 的 计算 思维 ,并 分 


为 北 据 实践 建 模 和 仿真 实践 .计算 问题 解决 实践 和 系 
统 雹 维 实践 四 大 类 ”1 ,他 们 将 档案 课程 中 不 同 的 知识 


与 计算 思维 对 应 ,并 构建 出 计算 思维 关联 图 书 情 
报 友 十 教育 的 两 种 方式 :一 是 创建 新 课程 教授 相关 知 
识 领 域 的 计算 思维 ;二 是 将 计算 思维 引入 研究 生 课 程 
SI 4 RUSLH rp 9777. ty feit x Ho 
的 深入 ,马里 兰 大 学 信息 学 院 还 致力 于 建设 用 以 展示 、 
共 台 和 教授 档案 工作 者 和 研究 人 员 实 践 的 计算 档案 学 
教育 系统 网 络 平台 ,通过 项 目 简介 .课程 计划 和 案例 文 


司 访问 。 马 里 兰 大 学 以 非 结 构 化 数据 的 自动 索引 
处 理 数据 文件 的 格式 转换 ,实现 不 同系 统 数据 的 访问 ， 
通过 编排 转换 和 提取 序列 描述 文本 图 像 ,构建 注释 语 
FUP", 

计算 档案 学 档案 分 析 方 向 主要 探讨 传统 与 新 兴 档 
案 材料 的 分 析 问 题 ,包括 文本 挖掘 ,数据 挖掘 ,情感 分 
析 \ 网 络 分 析 。 例 如 ,在 文本 与 数据 挖掘 方面 ,T. 
Blanke 使 用 “ 远 读 ”的 词 频 自动 化 分 析 和 主题 建 模 识 
别 近 80 年 英国 政府 白皮书 用 语 变 化 特征 ,并 开展 档案 
文本 的 时 代 分 类 和 政治 模式 的 演变 分 析 ;马里 兰州 
档案 馆 和 马里 兰 大 学 数字 管 护 创新 中 心 采 用 众 包 形式 
开展 奴隶 制 遗产 项 目 , 以 计算 方法 和 开放 源码 工具 将 
30 多 个 档案 系列 中 多 类 型 分散 的 文件 编码 集合 ,并 
以 可 视 化 工具 分 析 超 过 42 万 条 奴役 档案 数据 间 的 关 
系 ,来 反映 马里 兰州 的 妈 隶 制 和 非 裔 美国 人 的 真实 情 
WU ; 利 默 里 克 大 学 “埋葬 数据 "项 目 将 人 口 普查 报告 
的 文本 内 容 转化 为 细 粒 度数 据 ,探索 1864 - 1922 年 爱 
尔 兰 的 历史 ,并 使 用 机 器 学 习 算 法 来 描绘 潜在 社会 结 
构 模 式 ” 。 在 情感 分 析 方面 ,加 州 大 学 采用 三 步 社交 
媒体 相似 性 映射 方法 自动 识别 分 析 已 存档 的 Twitter 
记录 ,计算 与 测试 集合 的 情感 相似 度 以 第 查 新 冠 肺炎 


件 实 现 用 于 数字 档案 的 计算 案例 研究 和 课程 的 共享 ， 
DEAR A ALBA ALLA 

它 计算 档案 学 档案 处 理 方向 主要 探讨 档案 材料 的 处 
理 避 题 , 如 数字 化 ,电子 发 现 ,信息 识别 .鉴定 分类、 整 
理 熏 述 和 访问 ,数字 管 护 ,语义 本 体 , 关联 数据 ,主题 
建 模 , 自然 语言 处 理 ,机 器 学 习 等 。 例 如 ,在 数字 化 方 
面 ,欧洲 数据 基础 设施 (European Data Infrastructure , 
EUDAT) 使 用 OCR 技术 将 植物 标本 图 片 数字 化 ,采取 


疫情 防 控 期 间 的 各 类 情绪 趋势 ” ,如 利用 机 器 学 习 和 
数据 分 析 揭 示 和 证 实 新 冠 肺 炎 贫 恨 言论 推 特 档案 馆 
(COVID-19 Hate Speech Twitter Archive, CHSTA ) 内 档 
案 的 情感 趋势 ,为 危机 应 对 或 公共 政策 的 制定 提供 数 
Be 。 此 外 , 面 对 技术 应 用 伴生 的 伦理 难题 ,计算 档 
案 学 重视 解决 数据 安全 个 人 隐私 等 方面 的 问题 。 如 
荷兰 艺术 与 人 文 实验 室 创建 Jupyter Notebooks 归档 工 
有 具 以 提供 元 数据 存档 和 可 视 化 服务 ,结合 法 学 理论 销 


集成 计算 分 析 后 转移 到 可 信 数 字 存 储 库 ,实现 研究 数 
据 的 共享 和 长 期 保存 ”。 在 分 类 方面 ,N. Payne 比较 


定 网 络 环境 中 档案 信息 安全 和 个 人 隐私 保护 问题 "; 
美国 国会 图 书馆 国家 录音 保存 委员 会 在 建立 国家 广播 


了 数字 档案 自动 化 分 类 的 方法 ,提出 设计 分 类 精准 度 
和 文件 联系 度 并 重 的 系统 ,还 提出 以 机 器 学 习 方法 
融合 司法 ,历史 程序 业务、 技术 等 不 同 要 素 的 元 数据 
框架 来 实现 文件 的 自动 分 类 。 在 鉴定 方面 , 密 吹 根 
大 学 图 书馆 通过 创建 评估 选项 卡 工具 对 大 规模 数字 档 
案 开 展 敏感 信息 的 自动 识别 和 鉴定 。T. Hutchinson 
提出 利用 自然 语言 处 理 技术 开展 主题 建 模 ,帮助 识别 


记录 数据 库 时 以 政治 学 视角 预 设 不 同 主体 政治 代表 性 
的 平衡 问题 和 数据 道德 操守 问题 。 
计算 档案 学 档案 化 处 理 方向 主要 探讨 新 兴 文 件 或 
数据 ( 集 ) 的 档案 化 处 理 问题 ,包括 识别 .元 数据 生成 、 
完整 性 检查 ,规范 化 .区 块 链 、 匿 名 化 等 。 例 如 ,通过 数 
据 集 的 运算 对 欧洲 文化 遗产 数字 平台 的 元 数据 方案 完 
整 性 进行 测试 ” ;通过 对 基因 组 学 数据 管理 的 测试 应 


审查 文档 的 隐私 信息 ”或 以 监督 型 机 器 识别 个 人 信 
息 的 隐私 数据 管控 隐私 风险 。 在 描述 组 织 方面 ， 
EHRI 通过 收集 可 信 可 用 的 分 级 档案 元 数据 整合 大 量 


证 明 数据 集 标识 符 的 分 配 会 提升 数据 集 可 用 性 ; 
通过 区 块 链 创新 应 用 于 土地 交易 数据 、 健 康 档案 和 加 
密 货 币 数据 的 保存 模式 归纳 了 镜像 系统 .数字 记录 和 
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记号 代码 等 维护 文件 真实 性 与 安全 性 的 保存 策略 
等 。 另 外 ,T. Miksa 等 提出 通过 对 动态 的 数据 信息 流 
与 数据 模型 的 充分 认识 ,设计 具备 可 行 性 的 机 器 可 操 
作 数 据 管理 方案 ,确定 支持 数据 管理 任务 自动 化 的 必 
要 服务 和 基础 设施 组 件 “ ; H. Hamouda 等 结合 档案 鉴 
定理 论 与 工程 方法 开发 了 6 种 独特 的 视频 测试 方式 ， 
识别 视觉 组 件 .音频 组 件 和 元 数据 组 件 3 个 关键 组 件 ， 
核查 视频 内 部 一 致 性 与 外 部 一 致 性 。 


案 学 内 涵 逐 渐 清 晰 ,核心 领域 正 逐 步 被 识别 ,但 不 可 否 
认 , 计 算 档案 学 的 发 展 仍 处 于 初步 探索 阶段 。 通 过 对 
75 篇 外 文 文献 所 用 研究 方法 的 分 类 统计 ( 见 表 1) 发 
现 ,当前 国外 计算 档案 学 研究 方法 使 用 具有 明显 的 单 
一 化 倾向 , 非 实证 研究 文献 占 比 高 达 73.4% 。 且 非 实 
证 研究 中 案例 类 文献 和 介绍 类 文献 占 比较 大 ,说 明了 
计算 档案 学 作为 一 个 新 兴学 科 领 域 尚未 形成 较为 成 熟 
的 研究 框架 和 理论 体系 ,其 发 展 初期 学 界 重 点 关注 的 
是 对 此 领域 相关 基础 问题 以 及 相关 实践 案例 的 介绍 与 


2.3 计算 档案 学 的 发 展 仍 处 于 初步 探索 阶段 介绍 
自 2016 年 以 来 ,国内 外 多 个 学 科 领 域 学 者 介入 ， 分 析 。 
对 计算 档案 学 的 理论 与 实践 进行 了 持续 探索 ,计算 档 
R1 计算 档案 学 外 文 文献 研究 方法 分 类 统计 
一 级 类 目 二 级 类 目 解释 文献 数 /篇 占 比 /% 

PEKE 介绍 类 文献 介绍 计算 档案 学 相关 概念 .研究 和 实践 情况 16 21.3 
> 观点 类 文献 表达 作者 的 观点 .辨析 或 理解 10 13.3 
e 案例 类 文献 对 某 一 个 案 进行 全 面 分 析 与 揭示 29 38.7 
e ES 模型 类 文献 收集 数据 验证 和 修正 某 一 理论 模型 1 1.3 
实验 类 文献 设计 实验 来 测试 或 验证 某 些 技术 方法 19 25.3 


ATE CILE 2) ,发 现 当前 国外 计算 档案 学 研究 主 
胎儿 ,基础 研究 与 应 用 研究 呈现 出 较 大 的 数量 差距 , 基 
础 研究 文献 仅 占 24% ,而 应 用 研究 文献 占 76% ,表明 
i 卫 档 案 学 领域 的 探索 具有 很 强 的 “应 用 性 ”, 致力 于 
解决 档案 实践 当中 的 计算 技术 应 用 问题 。 具 体 而 言 ， 
在 应 用 研究 当中 ,关于 档案 处 理 的 研究 约 占 一 半 , 其余 
为 园 案 化 处 理 和 档案 分 析 主 题 ;在 基础 研究 当中 ,对 基 


础 理论 的 研究 较 多 ,计算 档案 学 教育 问题 涉及 较 少 。 
当前 计算 档案 学 领域 的 很 多 基本 问题 尚 待 解决 ,例如 ， 
计算 档案 学 的 研究 对 象 .研究 任务 研究 范围 等 缺乏 足 
够 探讨 。 同 时 由 于 研究 范畴 未 定 ,计算 档 案 学 与 数据 
科学 ,数字 人 文 ,数字 管 护 等 学 科 或 领域 的 关系 与 边界 
也 难以 明确 和 区 分 。 计 算 档 案 学 的 研究 框架 、 技 术 体 
系 .实践 路 径 等 相关 问题 也 尚未 明晰 。 


R2 计算 档案 学 外 文 文献 研究 主题 分 类 统计 


» BREA 二 级 类 目 类 目 说 明 文献 数 /篇 占 比 /% 
基础 研究 基础 理论 阐释 计算 档案 学 相关 概念 、 特 征 、 学 科 范 围 与 边界 等 13 17.3 
教育 研究 分 析 计 算 思 维 与 档案 思维 相关 教育 .培训 与 课程 设置 问题 5 6.7 
应 用 研究 档案 处 理 探讨 档案 材料 的 处 理 问题 ,如 电子 发 现 ` 个 人 信息 识别 ,鉴定 ,整理 和 描述 .访问 ， 38 50.7 
数字 管 护 ,语义 、 本 体 、 关 联 数据 。 主 题 建 模 、 自 然 语言 处 理 、 机 器 学 习 等 
档案 分 析 讨论 传统 与 新 兴 档 案 材 料 的 分 析 问 题 ,包括 文本 挖掘 、 数 据 挖掘 、 情 感 分 析 、 网 络 7 9.3 
分 析 
档案 化 处 理 。 ”讨论 新 兴 文 件 或 数据 ( 集 ) 的 档案 化 处 理 问题 ,包括 识别 \ 元 数据 生成 .完整 性 检 12 16.0 
查 、 规 范 化 .区 块 链 、 匿 名 化 等 


当然 ,如 果 从 学 科 的 视角 来 审视 计算 档案 学 ,笔者 
认为 计算 档案 学 尽管 有 发 展 成 为 一 门 学 科 的 潜力 ,但 
目前 而 言 ,其 尚 不 具备 成 为 一 门 学 科 的 条 件 。 当 前 , 国 


前 计算 档案 学 研究 成 果 绝 大 多 数 为 会 议论 文 , 仅 有 少 
量 期 刊 论文 ,专门 的 学 术 著 作 缺 乏 ,也 没有 创设 专门 的 
学 术 期 刊 ,学术 团体 和 研究 机 构 ,计算 档案 学 的 学 位 教 


际 上 虽 有 专业 学 术 会 议 来 探讨 计算 档案 学 问题 ,美国 
马里 兰 大 学 、 加 拿 大 英 属 哥伦比亚 大 学 和 英国 伦敦 国 
王 学 院 依 托 相关 人 研究 机 构 和 计算 基础 设施 也 零星 形成 
了 一 些 学 术 团队 和 合作 网 络 , 且 他 们 在 计算 档案 学 相 


育 更 是 空白 。 计 算 档案 学 的 可 持续 发 展 还 面临 巨大 的 

挑战 。 

3 中国 计算 档案 学 发 展 的 SWOT 分 析 
2016 年 以 来 ,在 多 个 国家 和 机 构 的 持续 关注 以 及 


关 课 程 建设 和 人 才 培 养 方面 进行 了 大 胆 的 尝试 ,但 当 
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AK, DH, 张 佳 欣 . 中 国 计 算 档案 学 发 展 的 SWOT 分 析 与 策略 研究 [J]. 图书 情报 工作 ,2022 ,66(4) :56 - 66. 


核心 研究 团队 的 推进 下 ,国外 计算 档案 学 鞍 勃 发 展 ,但 


实验 室 ,也 没有 形成 跨 学 科 的 合作 研究 团队 ,更 没有 任 


在 发 展 初 期 也 面临 诸多 困境 ,如 学 科 内 涵 不 清晰 、 研 究 
范围 与 边界 不 确定 等 。 在 中 国 ,计算 档案 学 的 相关 实 
践 与 学 术 研究 主要 分 散在 档案 数据 化 、 档 案 数据 治理 、 
智慧 档案 与 智慧 档案 馆 建 设 . 区 块 链 与 文档 管理 等 方 
面 。 中 国人 民 大 学 信息 资源 管理 学 院 、 上 海 大 学 图 书 


何 关 于 计算 档案 学 的 国家 级 科研 项 目 立 项 ,国内 学 界 
和 业界 对 于 计算 档案 学 能 否 适应 中 国学 科 建 设 与 学 术 
研究 环境 .如 何 融和 人 实践 发 展 等 问题 尚 缺 明确 答案 。 
为 此 ,笔者 试图 通过 SWOT 分 析 ,参考 国外 推进 计算 档 
案 学 发 展 的 实践 经 验 , 结 合 国内 政策 背景 ,学科 建设 与 


情报 档案 系 .四川 大 学 公共 管理 学 院 的 部 分 学 者 在 积 
极 追 踪 国 外 计算 档案 学 研究 动态 ,但 国内 计算 档案 学 
研究 偏向 基础 理论 ,应 用 研究 和 实践 探索 明显 滞后 。 
当前 ,国内 没有 建立 起 相关 的 计算 档案 学 研究 中 心 或 


实践 需求 等 审视 计算 档案 学 在 中 国 发 展 的 内 外 部 环 
境 , 以 探索 计算 档案 学 在 中 国 的 发 展 策略 ,如 表 3 
所 示 : 


RI 中 国 计 算 档案 学 发 展 的 SWOT BH 


优势 ( Strengths ) 


劣势 (Weaknesses) 


内 外 部 环境 * 已 确立 解决 实践 问题 的 两 条 思路 
已 形成 初 具 规模 的 学 科研 究 方向 


| 算 档案 学 资源 投入 还 严重 不 足 
。 计算 档案 学 研究 力量 还 极为 薄弱 
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究 平台 © 抓 住 复合 型 人 才 培 养 契 机 ,整合 多 方 资源 共 建 教学 平台 


ER 符合 档案 信息 化 发 展 战 略 要求 。 。 瞄准 领域 信息 化 战略 需求 ,形成 规模 化 在 


究 方向 。 围绕 实践 领域 的 核心 问题 ,探索 可 操作 的 技术 解决 方案 


leo 威胁 (Threats) S-T 策略 


W-T 策略 


CoA SNORE ERM 。 。 厘清 与 相关 学 科 的 边界 ,突出 计算 档案 学 的 特色 
。 发 挥 超 学 科 的 研究 优势 ,规避 数据 安全 隐私 风险 


人 -直到 数据 安全 风险 的 较 大 影响 


is 


3d 中 国 计 算 档案 学 发 展 的 外 部 环境 分 析 
30% 机 会 :符合 高 等 教育 与 人 才 培 养 趋势 
C2019 年 5 月 ,教育 部 等 13 个 部 门 联合 正式 启动 
“会 卓越 一 拔尖 "计划 2.0, 新 文科 建设 作为 此 项 计划 
的 重要 组 成 部 分 ,坚持 以 问题 为 导向 ,回应 社会 需求 ， 
强 沽 打破 学 科 壁 又 ,文理 相 融 ,进行 新 专业 或 新 方向 、 
新 慌 式 等 方面 的 探索 与 实践 '”! ,这 不 仅 反映 了 当前 中 
国 党 科 发 展 与 高 等 教育 人 才 培 养 的 新 趋势 ,同时 进 一 
HAS nf BC A: MORET ERES RU RU HUS 。 
新 和 科 建 设 下 ,呼吁 将 学 科 问题 与 数字 技术 深度 融合 ， 
实现 思辩 与 计算 相 结合 ,提升 人 文 社会 科学 数据 资源 
的 智慧 化 层次 。 而 计算 档案 学 正 是 以 数据 驱动 的 档案 
实践 与 档案 研究 问题 为 导向 ,回应 数 智 时 代 背 景 下 档 
案 与 历史 文化 ,社会 .科学 等 各 方面 存在 的 社会 需求 ， 
顺应 了 新 文科 及 文科 实验 室 建设 的 趋势 。 这 种 趋势 将 
促使 相应 平台 和 工具 的 开发 与 建设 ,如 数据 采集 处 理 、 
数据 长 期 保存 数据 可 视 化 等 通用 性 文科 实验 平台 ,i 
义理 解 、 细 粒度 知识 抽取 等 针对 性 系统 工具 等 ,这 些 平 
台 和 工具 将 为 计算 档案 学 的 发 展商 定 坚实 基础 。 此 
外 ,集成 实验 平台 的 研发 将 为 计算 方法 和 资源 应 用 于 
大 规模 的 文件 或 档案 的 处 理 、 分 析 、 存 储 ` 长 期 保存 和 
获取 工作 提供 经 验 , 有 利于 计算 思维 与 档案 思维 进行 
融合 塑造 一 个 全 新 的 超 学 科 领 域 。 
3.1.2 ”机 会 :符合 档案 信息 化 发 展 战略 要 求 

2020 年 新 修订 的 《中 华人 民 共和 国 档案 法 》 增 加 


DB 


强制 度 设计 与 技术 攻坚 ,做 好 档案 安全 风险 评估 与 管控 
大 基础 研究 ,明晰 计算 档案 学 的 理论 方法 和 技术 体系 


ej 
ej 


“档案 信息 化 建设 " 专 章 , 明 确 了 档案 信息 化 建设 的 总 
体 原 则 与 工作 重点 ,突出 了 档案 信息 化 建设 新 要 求 。 
在 “十 四 五 "期 间 , 中 国 档案 信息 化 战略 将 进一步 围绕 
数字 档案 资源 体系 ,应 用 系统 和 利用 体系 .基础 设施 与 
安全 体系 3 个 方面 的 任务 进行 规划 设计 , 且 朝 着 数据 
化 、 网 络 化 自动 化 .智能 化 等 方向 发 展 。 计 算 档 案 学 
以 及 相应 的 计算 档案 实验 室 的 建设 正好 符合 档案 信息 
化 战略 的 要 求 : 一 方面 ,计算 档案 学 致力 于 提高 数据 处 
理 效率 .生产 力 和 精确 度 ,通过 计算 方法 实现 档案 数据 
结构 化 处 理 .数据 关联 等 ,将 为 档案 数据 资源 开发 、 治 
H 共享 和 应 用 提供 强力 支撑 , 助 推 智慧 档案 应 用 平台 
的 建设 ; 男 一 方面 ,计算 档案 学 致力 于 解决 政府 企业 、 
科研 和 网 络 空间 等 行业 或 领域 新 兴 数 字 文件 或 数据 资 
源 的 档案 化 治理 ,长 期 保存 与 维护 ,为 数字 文件 单轨 运 
行 和 单 套 保存 、 数 据 连续 性 保障 提供 方法 指导 和 系统 
化 、 自 动 化 应 用 解决 方案 。 
3.1.3 威胁 :受到 相关 新 兴 交 又 学 科 的 冲击 

近 些 年 ,数据 科学 和 数字 人 文 等 交叉 学 科 在 中 国 
发 展 迅速 ,研究 机 构 更 如 雨后春笋 般 涌 现 。 据 教育 部 
统计 ,截至 2021 年 6 月 30 日 ,北京 大 学 清华 大 学 .中 
辐 科学 技术 大 学 .武汉 大 学 等 共 12 所 高 校 设 立 了 数据 
科学 这 一 交叉 学 科 , 涉 及 的 一 级 学 科 包 括 计算 机 科学 
与 技术 、 软 件 工程 .管理 科学 与 工程 图 书 情报 与 档案 
管理 ,数学 .统计 学 .信息 与 通信 工程 等 。 同 时 ,复旦 大 
学 .华东 师范 大 学 .云南 大 学 .中 国人 民 大 学 等 高 校 也 
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在 计算 机 科学 与 技术 ,软件 工 程 .管理 科学 与 工程 、 统 
计 学 等 一 级 学 科 下 增设 数据 科学 相关 二 级 学 科 。 中 国 
人 民 大 学 在 图 书 情报 与 档案 管理 一 级 学 科 下 增设 数字 
人 文 二 级 学 科 ,融合 信息 资源 管理 学 院 , 历 史学 院 、 国 
学 院 ,艺术 学 院 法 学 院 .环境 学 院 等 师资 队伍 ,探索 跨 
学 科 培 养 数字 人 文 新 文科 人 才 的 创新 道路 。 相 比 于 数 
据 科 学 与 数字 人 文 这 两 个 学 科 建设 的 热度 ,计算 档案 
学 还 未 受到 太 多 关注 ,加 之 与 数据 科学 ,数字 人 文 等 相 
关 学 科 边界 尚未 明确 ,在 学 科 建 设 的 基础 资源 和 方向 
的 集聚 方面 刚 兴起 的 计算 档案 学 易 被 忽视 和 受到 
冲击 。 
3.1.4 ”威胁 :受到 数据 安全 风险 的 较 大 影响 

当前 ,国家 对 档案 数据 安全 问题 尤为 重视 ,但 目前 
档案 数据 安全 法 规 体系 以 及 顶层 设计 尚 不 健全 ,档案 
数据 面临 黑客 侵袭 等 技术 风险 ,导致 档案 数据 的 安全 
PEPE BRA?) 。 档 案 机 构 对 档案 数据 安全 的 隐忧 ,制约 
案 数 据 的 规模 化 开放 与 开发 ,限制 了 档案 数据 资 
源 的 获取 途径 和 处 理 成 效 ,导致 计算 档案 学 研究 的 数 
据 资源 不 足 .研究 前 提 不 具备 。 当 前 ,中 国 档案 数据 开 
放 形 式 有 限 ,大 多 以 目录 数据 形式 开放 , 若 要 大 规模 地 
开 殉 档案 内 容 数 据 需 要 从 其 政策 .制度 ,技术 .平台 、 形 
开 烤 据 治理 成 熟 度 与 准备 度 评估 等 层面 进行 全 方位 
推 通 。 由 于 档案 人 员 技 术 知 识 的 匮乏 与 档案 机 构 复 合 
型 从 才 储备 的 不 足 ,大 规模 历史 档案 材料 的 处 理 、 分 析 
与 应 用 开发 都 依赖 于 第 三 方 ,导致 外 包 过 程 中 档案 数 
据 雁 在 诸多 安全 隐患 。 而 大 部 分 档案 机 构 害怕 承担 这 
种 入 险 , 不 愿意 让 馆藏 资源 脱离 其 保管 场所 和 管控 范 
畴 6 对 于 第 三 方 的 介入 也 保有 非常 谨慎 的 态度 。 这 些 
安 会 隐患 的 存在 以 及 档案 机 构 对 风险 的 担 优 都 会 在 一 
定 程度 上 阻碍 致力 于 大 规模 文件 或 档案 材料 处 理 与 研 
究 的 计算 档案 学 的 发 展 。 
3.2 ”中 国 计 算 档案 学 发 展 的 内 部 环境 分 析 
3.2.1 优势 :已 确立 解决 实践 问题 的 两 条 思路 

当前 ,计算 档案 学 实践 思路 已 逐渐 清晰 :一 方面 ， 
致力 于 解决 档案 部 门 数据 化 、 网 络 化 .自动 化 和 智能 化 
转变 过 程 中 遇 到 的 问题 。 例 如 ,大 规模 档案 材料 的 敏 
感性 审查 .隐私 和 开放 鉴定 问题 ;新 兴 原 生 数字 态 和 数 
据 态 档案 材料 的 价值 鉴定 与 保存 决策 问题 ;以 历史 、 社 
会 .科学 文化 研究 需求 等 为 导向 的 大 规模 档案 材料 的 
挖掘 和 研究 问题 等 ,涉及 将 计算 方法 和 资源 运用 到 大 
规模 文件 或 档案 材料 的 处 理 分析、 存储, 长 期 保存 和 
获取 。 另 一 方面 ,致力 于 解决 社会 各 领域 新 兴 数 字 文 
件 和 (大 ) 数 据 治理 过 程 中 遇 到 的 问题 。 例 如 ,政府 数 
据 资源 的 长 期 保存 问题 .科学 大 数据 的 档案 化 保存 问 


题 ,数据 分 析 与 治理 活动 过 程 的 文件 保存 问题 数据 态 
遗产 的 价值 鉴定 与 长 期 保存 选择 标准 问题 .大 数据 安 
全 治理 与 个 人 隐私 保护 问题 等 ” ,确保 电子 档案 满足 
来 源 可 靠 ,程序 规范 、 要 素 合 规 等 要 求 ,确保 数据 资源 
符合 连续 性 、 可 追溯 性 、 可 信 性 ,可靠 性 ,安全 性 等 要 
求 ,涉及 将 档案 理论 与 方法 运用 到 大 数据 治理 以 及 各 
部 门 新 兴 数 字 文 件 的 保存 当中 。 
3.2.2 ”优势 :已 形成 初 具 规模 的 学 科研 究 方向 

计算 档案 学 这 一 新 兴 超 学 科 领 域 存在 巨大 潜力 ， 
形成 一 些 初 具 规 模 的 研究 方向 ,并 且 已 有 相关 实践 作 
为 支撑 ,例如 国外 学 者 通过 8 个 案例 展示 不 同 交叉 学 
科 努 力 解决 档案 实践 环境 的 变化 ,提出 构建 计算 档案 
学 8 个 领域 下 的 应 用 方式 ,围绕 档案 材料 分 析 、 开 
发 新 形式 档案 .提供 档案 化 处 理 的 拓展 服务 .用 于 以 档 
案 与 馆藏 为 基础 的 研究 以 及 网 络 基础 设施 建设 、 大 数 
据 和 档案 的 理论 与 实践 等 方面 初步 形成 了 基础 理论 、 
教育 研究 .档案 处 理 、 档 案 分 析 、 档 案 化 处 理 5 个 理论 
研究 与 实践 探索 的 方向 。 立 足 国 内 实践 思路 ,计算 档 
RPK US Rat RE SARS 
案 馆 、 档 案 知识 发 现 与 知识 服务 .档案 数据 治理 、 档 案 
数据 基础 设施 建设 .档案 数据 开放 、 档 案 数 据 保全 、 区 
块 链 与 文档 管理 、 人 工 智 能 与 文档 管理 ,可 信和 数字 文 
fF .档案 化 与 数字 管 护 等 方向 为 基础 ,整合 分 散 于 其 中 
的 研究 内 容 ,并 形成 新 的 统一 ,整体 的 认识 。 
3.2.3 劣势 :计算 档案 学 资源 投入 还 严重 不 足 

当前 是 计算 档案 学 在 国外 兴起 的 第 五 年 ,以 美国 
马里 兰 大 学 信息 学 院 及 其 数字 管 护 创 新 中 心 为 首 的 研 
究 机 构 围 绕 计算 档案 学 的 建设 发 展 投入 了 一 定数 量 的 
资源 ,包括 :网 络 基础 设施 等 计算 资源 ,启动 用 于 开发 
维护 大 规模 管理 文件 数据 的 数字 存储 库 软 件 DRAS- 
TIC iX ^U ;人 财物 资源 ,与 美国 国家 档案 与 文件 署 、 
马里 兰州 档案 馆 等 档案 机 构 进 行 合作 ,由 合作 的 档案 
机 构 提供 可 供 分 析 挖 掘 的 档案 资源 ,马里兰 大 学 信息 
学 院 及 其 学 生 团 队 、 档 案 机 构 工 作 人 员 等 人 员 在 美 
辐 博 物 馆 与 图 书馆 服务 协会 .美国 国家 科学 基金 会 
等 基金 的 资助 下 合作 开展 项 目 。 而 国内 与 计算 档案 
学 相关 的 探索 才 起 步 。 目 前 , 仅 有 浙江 省 档案 馆 、 青 
岛 市 档案 馆 等 极 少 数 机 构 在 此 领域 进行 了 大 胆 尝 
试 ,例如 浙江 省 档案 馆 提 出 建设 档案 数据 中 心 , 并 以 
此 为 契机 与 阿里 云 计 算 有 限 公司 签署 智慧 档案 研究 
合作 框架 协议 ,攻坚 档案 开放 上 鉴定、 档案 数据 治理 等 
难题 。 总 体 上 看 ,中国 在 计算 档案 学 资金 .计算 资源 
等 方面 的 投入 还 严重 不 足 , 不 利于 计算 档案 学 的 建 
设 与 发 展 。 
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3.2.4 劣势 :计算 档案 学 研究 力量 还 极为 薄弱 
理想 状态 下 的 计算 档案 学 研究 人 员 需 要 兼备 档案 
思维 和 计算 思维 ,但 目前 大 部 分 档案 学 研究 人 员 缺 乏 
计算 思维 和 熟练 运用 相关 计算 方法 的 技能 ,而 计算 机 
科学 研究 人 员 缺 乏 档案 思维 。 当 前 ,国外 计算 档案 学 
的 研究 力量 主要 来 自 高 校 研究 机 构 ,档案 机 构 , 形 成 了 
跨 界 合作 模式 ,实现 资源 和 技术 的 互补 。 而 目前 国内 
计算 档案 学 研究 力量 主要 来 自 高 校 研究 机 构 ,缺少 跨 
学 科研 究 团队 。 一 方面 ,档案 学 界 并 未 明晰 统一 计算 
档案 学 内 涵 与 边界 , 跨 学 科 的 交流 与 合作 存在 极 大 阻 
碍 。 不 同学 科 对 计算 档案 学 的 重视 程度 不 同 ,其 参与 
定位 和 角色 动机 不 够 明朗 。 另 一 方面 ,档案 学 界 并 未 
提出 具有 普 适 性 和 系统 性 的 复合 型 档案 人 才 培 养 体 
系 。 面 对 兼备 档案 思维 和 计算 思维 的 要 求 ,国内 需要 
以 跨 界 合作 的 观念 组 建 跨 学 科 团 队 共同 开展 计算 档案 
学 的 研究 和 实践 ,围绕 计算 档案 学 应 用 计算 方法 和 资 
理 分 析 大 规模 文件 /档案 以 提高 效率 和 精确 度 的 
楼 轧 目 的 ,探索 契合 计算 思维 方法 与 档案 思维 方法 的 
研究 方法 。 


中 国 计 算 档案 学 发 展 的 策略 研究 


机 会 (SO ) 策略 
Si 首先 ,要 依托 交叉 学 科 的 建设 机 遇 , 打 造 超 学 科研 


¢ 
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KER. HRA SRE AAD PEE 
mE IE A RISS AAE HAE BL ER I A 
Ade, 与 计算 机 科学 .信息 科学 等 学 科 共 同 组 建 研究 团 
队 人 让 住 国家 鼓励 学 科 融 合 建立 新 学 科 的 新 文科 建设 
机 句 , 利 用 政策 优势 ,积极 探索 建设 超 学 科 的 方法 创 
新 6 建立 跨 学 院 . 跨 学 科 的 超 学 科研 究 平台 。 其 次 ,要 
瞄准 领域 信息 化 战略 需求 ,形成 规模 化 研究 方向 。 国 
外 学 者 提出 的 计算 档案 学 领域 研究 主题 与 方向 涉及 面 
甚 广 ,如 大 数据 .图形 分 析 .数字 人 文 , 网 络 基础 设施 建 
设 等 。 而 面向 国内 ,需要 考察 中 国政 府 信息 化 .档案 信 
息 化 文化 信息 化 等 领域 信息 化 战略 需求 与 现实 问题 ， 
对 接 计 算 档案 学 的 理论 .思维 与 方法 输出 ,重点 关注 档 
案 数据 开发 与 利用 ,数据 连续 性 保障 .档案 数据 管 护 与 
治理 等 问题 ,以 实践 需求 集聚 与 壮大 具有 国内 特色 的 
计算 档案 学 研究 方向 。 
4.2 ”优势 一 威胁 ( ST) 策略 

首先 ,要 厘清 与 相关 学 科 的 边界 ,突出 计算 档案 学 
的 特色 。 计 算 档案 学 作为 “计算 + ”学科 阵列 当中 的 
新 成 员 , 是 基于 档案 学 ,信息 科学 .计算 机 科学 等 学 科 
要 素 重组 而 创造 出 新 知识 的 超 学 科 领 域 。 由 于 当前 计 
算 档案 学 学 科 框 架 还 未 完全 形成 , 尚 存在 与 数字 人 文 、 


数据 科学 等 相关 学 科 重 合 的 领域 ,与 其 差异 与 边界 也 
尚未 形成 较为 明确 的 认 知 。 要 和 弄 清 计算 档案 学 与 相关 
学 科 的 边界 ,首先 要 明确 计算 档案 学 的 学 科 体系 和 研 
究 框 架 ,在 此 基础 上 可 以 抓 住 学 科 内 涵 探 究 学 科 发 展 
范围 与 领域 ,探寻 未 来 发 展 方向 ,同时 可 以 找 准 与 数字 
人 文 数据 科学 等 相关 学 科 的 明确 区 别 , 形 成 与 计算 社 
会 科学 .计算 语言 学 .计算 情报 学 等 相 区 别 的 独立 身份 
和 特征 ,突出 计算 档案 学 的 特色 。 其 次 ,要 发 挥 超 学 科 
的 研究 优势 ,规避 数据 安全 隐私 风险 与 技术 伦理 风险 。 
数 智 时 代 的 到 来 虽 极 大 推动 了 社会 的 变革 ,但 技术 应 
也 加 剧 数据 安全 风险 ,同时 伴生 道德 伦理 问题 ,为 国 
家 和 和 领域 数据 安全 保障 带 来 严峻 挑战 。 无 论 是 政府 开 
放 数 据 、 科 学 数据 .研究 数据 还 是 档案 部 门 管控 的 档案 
数据 ,要 实现 数据 资源 的 开放 、 开 发 .交易 、 利 用、 共享 
等 ,前 提 是 解决 好 数据 安全 \ 保 密 和 隐私 等 问题 ,尤其 
是 不 能 危害 总 体 国 家 安全 。 计 算 档 案 学 是 计算 理论 方 
法 与 档案 理论 方法 的 有 机 融合 ,对 于 解决 数据 安全 和 
隐私 问题 有 先天 优势 。 因 此 ,在 计算 档案 学 领域 的 发 
展 当 中 ,要 发 挥 出 这 种 超 学 科 的 研究 优势 ,为 规避 和 防 
控 数 据 安 全 和 隐私 风险 提供 理论 .方法 和 技术 支撑 。 
4.3 ”劣势 一 一 机 会 (WO ) 策略 

首先 ,要 抓 住 复合 型 人 才 培 养 契 机 ,整合 多 方 资源 
共 建 教学 平台 。21 世纪 以 来 ,在 信息 技术 的 驱动 下 ， 
既 懂 技术 又 懂 管 理 的 复合 型 人 才 需 求 急 剧 攀升 ,政府 
言 息 化 .档案 信息 化 等 领域 尤其 ,但 一 直 以 来 ,中 国 档 
案 学 或 公共 管理 等 学 科 的 人 才 培 养 当中 并 未 有 效 解 决 
复合 型 人 才 培 养 的 问题 。 计 算 档 案 学 的 出 现 为 弥合 兼 
具 计 算 思 维和 档案 思维 的 复合 型 人 才 培 养 缺 口 带 来 了 
契机 。 应 先进 行 跨 学 科教 学 平台 搭建 ,集中 多 学 科 师 
资 力量 ,讨论 制定 计算 档案 学 课程 体系 ,将 不 同学 科 的 
HH Rl A BCE VUE nn UH ,全 面 改 造 档案 学 传统 核心 专 
业 课 程 内 容 , 开 发 培养 计算 思维 的 档案 技术 类 应 用 课 
程 等 。 同 时 ,整合 学 科 文 献 资源 .技术 设备 资源 、 校 内 
外 合作 资源 等 多 种 资源 建立 学 科 实 践 平台 ,借鉴 国外 
iSchool 项 目 式 培养 模式 ,建设 产 学 研 创新 基地 ,让 学 生 
参与 计算 档案 学 项 目的 实践 ,从 实践 中 掌握 计算 档案 
学 相关 知识 和 方法 。 其 次 ,要 围绕 实践 领域 的 核心 问 
题 ,探索 可 操作 的 技术 解决 方案 。 将 实践 需求 转化 为 
学 科 发 展 的 问题 导向 ,围绕 领域 信息 化 发 展 战略 需求 
和 领域 数据 管理 的 核心 问题 ,依托 计算 档案 学 探索 可 
操作 的 技术 解决 方案 。 例 如 ,围绕 区 块 链 技 术 的 应 用 
探索 可 信和 数字 档案 建设 的 解决 方案 ,围绕 电子 档案 的 
四 性 检测 问题 探索 一 体 化 的 四 性 检测 工具 ,围绕 人 工 
智能 技术 的 应 用 探索 开放 档案 智能 鉴定 的 解决 方 
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案 等 。 
4.4 ”劣势 一 威胁 ( WT) 策略 

首先 ,要 加 强制 度 设计 与 技术 攻坚 ,做 好 档案 安全 
风险 评估 与 管控 。 自 21 世纪 以 来 , 随 着 经 济 社会 的 快 
速 发 展 ,档案 工 作 所 处 的 内 外 部 环境 日 趋 复杂 ,危及 档 
案 安 全 的 传统 风险 与 非 传统 风险 日 益 增 多 ,确保 档案 
安全 成 为 中 国 档案 事业 发 展 的 重要 内 容 。 当 前 ,在 各 
领域 开放 运动 背景 下 ,从 档案 开放 走向 档案 数据 开放 ， 
需要 依据 新 修订 档案 法 的 规定 ,做 好 自 上 而 下 的 开放 
政策 与 制度 设计 以 及 自 下 而 上 的 数据 开放 技术 攻坚 ， 
重点 解决 档案 数据 开放 中 的 开放 与 保密 的 矛盾 、 处 理 
好 数据 开放 与 隐私 保护 的 关系 ;以 项 目 为 依托 ,以 自然 
语言 处 理 . 机 器 学 习 等 技术 为 切入 点 ,针对 文本 、 图 像 、 


案 学 不 仅 是 计算 机 科学 向 档案 学 单 向 输出 方法 BOR 
而 是 档案 学 与 其 他 学 科 之 间 多 向 输出 ,档案 学 科 应 抓 
住 计 算 档 案 学 发 展 的 契机 输出 档案 学 科 知 识 、 理 论 与 
方法 ,扩大 档案 学 科 影响 力 。 计 算 档 案 学 在 国际 上 的 
兴起 并 非 偶然 ,新 的 档案 形式 的 不 断 出 现 ,呼吁 多 学 科 
领域 的 共同 应 对 ;传统 档案 工作 加 速 转型 ,也 要 求 计算 
思维 与 方法 的 介入 ;复合 型 档案 人 才 缺 口 绞 大 ,更 需要 
创新 档案 高 等 教育 方式 。 当 前 ,经 过 国内 外 学 者 的 探 
索 , 计 算 档 案 学 超 学科 内 涵 逐 渐 清 晰 ,核心 领域 正 逐 步 
被 识别 ,但 其 学 科 边 界 .研究 框架 .技术 体系 、 实 践 路 径 
等 尚未 明晰 , 仍 需 进一步 探讨 。 本 文 基于 SWOT 分 析 
法 在 一 定 程 度 上 提出 了 中 国 计 算 档案 学 的 发 展 策 略 ， 
但 由 于 计算 档案 学 的 发 展 尚 处 于 初步 阶段 ,尤其 是 中 


音频 .视频 的 不 同类 型 以 及 电子 邮件 .电子 公文 .网 页 
文 时 .社交 媒体 文件 等 不 同形 式 的 处 理 对 象 ,加 强 开放 
和 区 全 鉴定 的 技术 攻关 ;此 外 ,要 做 好 档案 数据 安全 风 
rft ,识别 潜在 的 .可 能 发 生 的 档案 数据 安全 风险 要 
孝 防 范 档案 形成 机 构 及 其 工作 人 员 的 风险 性 行为 ,及 
时 消除 档案 安全 隐患 ,以 弥补 或 减少 损失 。 同 时 ,在 认 


伴 避 数据 处 理 优势 在 解决 不 同 实际 需求 的 基础 上 ,能 
注 量 消 可 不 同 群体 问 共享 资源 的 距离 。 其 次 ,要 加 大 
基 三 研究 的 投入 与 支持 ,明晰 计算 档案 学 的 理论 .方法 
和 技术 体系 。 中 国 自 21 世纪 初 以 来 规模 化 开展 的 档 
案 瞩 字 化 工程 ,为 计算 档案 学 奠定 了 良好 的 基础 ,一 方 
面 开 何在 繁琐 宛 余 的 低 价值 密度 数据 中 通过 数据 方法 
剥 密 出 有 价值 的 信息 , 另 一 方面 又 要 如 何 避 免 技术 给 
档 钢 带 来 的 消极 影响 ,如 何在 新 技术 环境 下 理解 文件 ， 
解决 这 些 问题 都 需要 档案 工作 者 和 计算 机 科学 家 的 深 
入 合作 。 而 目前 计算 档案 学 发 展 时 间 短 暂 , 学 科 发 展 
尚未 成 熟 ,应 加 大 对 其 基础 研究 的 投入 ,明确 计算 档案 
学 基础 理论 和 方法 论 , 从 而 克服 计算 档案 学 实践 应 用 
的 潜在 问题 。 


5 结语 


在 数 智 时 代 ,图 情 档 学 科 需 要 有 新 的 社会 贡献 力 ， 
并 且 吸 需 在 新 时 期 发 出 自己 的 声音 。 数 智 时 代 的 到 来 
与 伴生 的 变化 为 图 情 档 带 来 新 的 挑战 ,档案 学 科 和 档 
案 职 业 必 须 广泛 关注 并 积极 回应 社会 的 重大 挑战 。 面 
对 信息 化 与 大 数据 管理 的 实践 需求 ,依靠 档案 学 知识 
已 无 法 准确 高 效 回应 ,档案 学 者 们 已 经 关注 到 档案 学 
科 必 须 和 其 他 学 科 合作 共同 应 对 新 挑战 。 计 算 档案 学 
的 发 展 提供 了 学 科 间 交流 合作 融合 的 平台 。 计 算 档 


到 计算 档案 学 的 建设 并 未 在 实践 层面 全 面 展 开 ,因此 
本 文 利用 SWOT 定性 分 析 得 到 的 结论 偏 于 宏观 和 主 
观 ,存在 不 足 , 未 来 的 研究 还 可 进一步 结合 多 学 科 专 家 
咨询 或 深度 访谈 等 方法 了 解 图 情 档 学 界 和 业界 对 中 
推进 计算 档案 学 的 态度 或 建议 。 
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Abstract: | Purpose/significance | This paper reviews the current situation of the development of computational 
archival science (CAS) , explores the development strategies of CAS in China, and provides a reference for the de- 
“Clopment of CAS in China under the background of the construction of new liberal arts. | Method/process | Based 
6n, literature research, this paper sorted out the current development situation of CAS, and analyzed the internal and 
external environmental factors such as opportunities, threats, advantages, and disadvantages of the development of 
CAS in China by SWOT analysis method , and formed different development strategies through the cross matching of 
internal and external factors. | Result/conclusion | It is found that the development of CAS has received sustained 
attention internationally and has initially established the direction of theoretical research and practical exploration a- 
round basic theory, educational research, archives processing, archives analysis, and archival processing, but in 
general, the development of CAS is still in the preliminary exploration stage. This paper proposes that, in order to 
promote CAS in China, we should pay attention to the following aspects: relying on the opportunities of interdiscipli- 
nary construction to build a platform for transdisciplinary research ; aiming at the strategic needs of field informatiza- 
tion, and forming a large-scale research direction; clarifying the boundaries with related disciplines, and highlighting 
the characteristics of CAS; taking advantages of transdisciplinary research to avoid data security privacy risks; seizing 
the opportunities of cultivating interdisciplinary talents, and integrating multiple resources to build a teaching practice 
platform; exploring operable technical solutions around the core problems in the field of practice; strengthening insti- 
tutional design and technical breakthroughs , and doing well in archives security risk assessment and control; and in- 
creasing basic research , and clarifying the theories, methods and technical systems of CAS. 
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